Puma Kataris & Big Data

Rafael López V.

Antecedentes: 1er sistema de transporte urbano masivo en Bolivia



Ver mas en: lapazbus.bo



Objetivos:

Mostrar que conectando los buses al Big Data el servicio puede ser monitoreado, segundo a segundo, y mejorado para el bien de la gente y del municipio

Para lograr el objetivo:


Se han simulado casi 700 mil datos sobre el recorrido de los buses

La simulación trata de acercarse a la realidad lo más posible





Alcances de la simulación

Se eligió 1 de las 6 rutas



Se eligió una dirección de la ruta



Se tomaron los tiempos 5 veces en horas que se suponen normales (sin tráfico, protestas, etc)


Se introdujeron alteraciones predecibles a la normalidad


  • Paradas con más gente que otras

  • Tramos mas lentos que otros: tráfico vehicular

  • Marchas y bloqueos en el centro de la ciudad

  • Horas que afectan los tiempos en los tramos (v.g. medio día vs. media noche)

Se supuso que los buses al pasar por las paradas generan automáticamente los datos





Se computaron los intervalos oficiales de partida y con todo lo anterior se simularon casi 700 mil datos en R

Muestra de la simulación en R





Resultados de la simulación







Estadísticas: Sugiero que imagine que así se podrá monitorear el servicio


- 97% de los viajes tardan entre 52 y 60 minutos desde la primera hasta la última parada
- Sin embargo, a veces los buses tardan hasta 175 minutos (casi 3 horas)
- Veamos qué días y a qué horas se producen los mayores atrasos


- Los 4 picos muestran atrasos por protestas sociales
- ¿En qué tramos están las protestas?


- Los tramos entre las paradas 1 y 4 son los menos regulares. Los mayores atrasos se generan allí
- Veamos en detalle estos tramos, sabiendo que son los que generan los atrasos





Para ver el atraso por tramos y horas se utilizaron “boxplots”. Ver la siguiente explicación


Veamos el mismo gráfico pero sin valores extremos


Hasta aquí:

Las protestas sociales en 4 días del mes produjeron los atrasos mas considerables

Las protestas ocurren en el centro y perjudican a las paradas 1, 2 y 3

Las protestas afectan a los buses que transitan entre las 11am y 5pm




¿Los atrasos se dan únicamente por protestas sociales?

Veamos los tiempos de recorrido excluyendo los días de las protestas


En días “calmados” el tiempo más rápido del Puma Katari es de 51 minutos pero el mas lento de 64 minutos





¿Qué tramos podrían corregirse y a qué horas para que los buses sean mas predecibles?


Los tramos 1-2 y 3-4 son los que tienen mayor variación
Antes cerciorémonos que los otros tramos no tienen variaciones extremas

La mayoría de los buses en estos tramos tienen variaciones de tiempo de menos de un minuto. Los problemas mas serios no están en estos tramos





Se sabe que los tramos 1-2 y 3-4 son los que generan los mayores atrasos. Pero, ¿a qué horas?

Los mayores problemas están a horas 7,8,9,13,14,19 y 20

Las distorsiones de tiempo están claramente a las 7 y 8 de la mañana





¿Es posible que los atrasos se originan por la tardanza de los pasajeron al subir al bus en horas y paradas pico?

Los pasajeron no contribuyen significativamente al atraso. En promedio un bus necesita 18.01 segundos para subir a los pasajeros





Resumen hasta aquí



Problema 1: protestas sociales


77 días

Es la suma del tiempo perdido de los pasajeros en los 4 días de protestas




Problema 2: tramos y horas pico


155 días


Es la suma del tiempo perdido de los pasajeros excluyendo los 4 días de protestas en un mes

El desafío es pasar del modelo azul al rojo: tiempo total del recorrido





Se sabe sobre qué tramos y horas se debe actuar. Después, los datos nos dirán si las reformas son efectivas o no





Propuesta

No se necesita mucho



Los datos de la simulación pesan 14 megabytes o 2% de un DVD



Los datos para todas las rutas por año pesarían 19 gigabytes o 4 DVD`s






rafa lópez v.